Amazon EMR (Elastic MapReduce)
大規模なデータ処理をクラウド上で行うためのサービス
大量のデータを分散処理し、ETL処理や機械学習、データ分析、バッチ処理
マスターノード:クラスタの管理とリソースの割り当てを行う。
コアノード:
HDFS(分散ファイルシステム)
ストレージを持ち、計算処理を担当する。
タスクノード:計算処理のみを担当し、HDFSのストレージは持たない。